Entrepôts de données multidimensionnelles NoSQL
نویسندگان
چکیده
Résumé. Les données des systèmes d’analyse en ligne (OLAP, On-Line Analytical Processing) sont traditionnellement gérées par des bases de données relationnelles. Malheureusement, il devient difficile de gérer des mégadonnées (de gros volumes de données, « Big Data »). Dans un tel contexte, comme alternative, les environnements « Not-Only SQL » (NoSQL) peuvent fournir un passage à l’échelle tout en gardant une certaine flexibilité pour un système OLAP. Nous définissons ainsi des règles pour convertir un schéma en étoile, ainsi que son optimisation, le treillis d’agrégats pré-calculés, en deux modèles logiques NoSQL : orienté-colonnes ou orienté-documents. En utilisant ces règles, nous implémentons et analysons deux systèmes décisionnels, un par modèle, avec MongoDB et HBase. Nous comparons ces derniers sur les phases de chargement des données (générées avec le benchmark TPC-DS), de calcul d’un treillis et d’interrogation.
منابع مشابه
Modélisation et interrogation de données XML multidimensionnelles
Résumé. XML étant devenu omniprésent et ses techniques de stockage et d’interrogation de plus en plus efficaces, le nombre de cas d’utilisations de ces technologies augmente tous les jours. Un sujet prometteur est l’intégration d’XML et des entrepôts de données, dans laquelle une base de données XML native stocke les données multidimensionnelles et exécute des requêtes OLAP écrites à l’aide du ...
متن کاملPanorama de travaux autour de l'intégration de données spatio-temporelles dans les hypercubes
Résumé : Cet article présente un panorama des différents travaux qui sont effectués dans notre équipe autour de l’intégration des données spatiotemporelles dans les entrepôts de données et les hypercubes. Nous nous sommes plus particulièrement intéressés à la prise en compte des évolutions dans les dimensions spatiales, à la modélisation multidimensionnelle de données continues et à la concepti...
متن کاملModèle darchivage dentrepôts de données multidimensionnelles
Data warehouses are commonly used for decision making. Data integrated by these systems is, on the one hand, periodically updated and permanently stored on the other hand. When data is historized, decision-makers are usually less interested in old information, but still integrating it into their analysis. In this paper, we present a new mechanism for data archiving and summarizing across the ti...
متن کاملFouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure
Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en co...
متن کاملAnalyse multidimensionnelle de documents via des dimensions OLAP
RÉSUMÉ. Avec l’émergence de formats de données semi-structurés (tels que XML), le stockage de documents dans un entrepôt centralisé est apparu de façon naturelle comme une adaptation des entrepôts de données. De nos jours, les systèmes OLAP (On-Line Analytical Processing) font face à une part grandissante de données non numériques. Cet article présente un environnement pour l’analyse multidimen...
متن کامل